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摘要 : [目的 /意义 ] 对 我 国文 献 资源 保障 体系 论文 主题 演化 的 路 径 进行 分 析 ， 为 重 构 我 国文 
献 资源 保障 体系 提供 借鉴 。[ 方法 / 过程 ] 主要 使 用 LDA 模型 对 所 搜集 到 的 文献 进行 聚 类 ， 首 
先 以 时 间 段 为 划分 依据 ， 绘 制 主题 词 共 现 网 络 ， 探 索 各 主题 之 间 的 交互 关系 ， 后 通过 相似 度 计 
算 判 定 各 主题 内 部 的 演化 路 径 并 绘制 又 基 图 以 可 视 化 形式 展现 演化 结果 。[ 结果 / 结论 ] 研究 
发 现 我 国文 献 资 源 保障 体系 的 相关 主题 在 2000 年 左右 均 已 基本 出 现 ， 主 题 主 要 包含 资源 角度 和 
机 构 角 度 两 大 类 ， 且 受 计算 机 技术 和 国家 政策 影响 较 大 ， 并 针对 该 两 大 类 主题 ， 给 出 相应 的 对 
策 与 建议 。 
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设 ， 建立 起 能 在 一 定 范围 内 有 效 保障 社会 文献 
需求 的 文献 信息 资源 系统 一 一 文献 资源 保障 体 
系 中 6 

在 这 样 一 个 本 该 互联 互通 的 时 代 浪 潮 之 下 ， 
国外 数据 库 商 依仗 其 丰富 的 文献 资源 ， 坐 地 起 
价 ， 企 图 继续 垄断 资源 ， 引 发 了 国内 图 书包 人 
的 不 满 。 欧 洲 大 学 协会 (European University 


@@ 引 言 

目前 全 球 竞相 步 人 5G ( 第 五 代 移动 电话 行 
动 通信 标准 ,也 称 第 五 代 移动 通信 技术 ) 时 代 ， 
相 比 之 前 的 4G 时 代 ， 网 络 数据 的 传输 速度 将 会 
更 快 ，5G 技术 可 以 被 更 快速 更 高 效 地 运用 到 多 
个 领域 。 传 统 的 文献 资源 与 新 型 的 数字 文献 资 
源 数量 不 断 累 积 ， 通 过 文献 信息 资源 的 整体 建 
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< 局 一 
Association，EUA ) 发 布 的 一 份 报告 显示 ， 学 术 
机 构 、 图 书馆 与 美国 化 学 学 会 (ACS ) 、 爱 思 
唯 尔 ( Elsevier ) 、 威 利 ( Wiley ) 、 施 普 林 格 : 自 
然 ( Springer Nature ) 和 泰勒 弗朗西斯 集团 ( Taylor 
& Francis ) 等 出 版 商 的 交易 成 本 正 以 每 年 3.6% 
的 速度 上 涨 。 文 献 资源 ,尤其 是 科技 文献 资源 ， 
是 对 科学 最 新 前 沿 研 究 结果 的 展现 ， 如 果 放 弃 
相关 资源 的 购买 ， 则 会 丧失 国际 科研 竞争 力 ; 
如 果 继 续 服从 霸王 条 款 ， 依 然 无 法 改变 被 动 的 
局 面 。 故 而 ， 在 以 程 焕 文 先生 为 代表 的 《十 问 
数据 商 !!!》 等 一 系列 请问 之 后 ， 重 构 我 国 的 文 
献 资源 保障 体系 成 为 当务之急 。 

目前 国外 已 有 一 部 分 高 校 通过 开放 获取 出 
版 的 方式 应 对 数据 商 垄 断 价格 的 胁迫 。2019 年 
2 月 ， 加 州 大 学 在 终止 与 爱 思 唯 尔 的 协议 后 ， 于 
同年 4 月 ， 同 剑桥 大 学 出 版 社 签署 了 美国 史上 
第 一 个 开放 获取 出 版 协议 。 但 我 国 至 今 还 没有 
能 够 有 效应 对 涨 价 的 完整 的 文献 资源 保障 体系 
方案 。 重 构 文献 资源 保障 体系 长 路 漫漫 ， 把 握 
好 重 构 之 路 需要 对 过 往 已 有 的 研究 进行 宏观 上 
的 把 握 。 通 过 对 过 往 研究 的 梳理 ， 了 解 文献 资 
源 保障 体系 这 一 框架 之 下 具有 哪些 方面 的 研究 
主题 和 工作 内 容 ， 有 利于 为 重 构 文献 资源 保障 
体系 提供 指导 借鉴 ， 有 利于 改变 近 几 年 被 计算 
机 技术 牵 着 鼻子 被 动向 前 的 发 展 局 面 ， 从 而 以 
历史 为 指针 ， 以 新 兴 技 术 为 滚轮 ， 构 建 起 自给 
自足 的 、 能 够 与 国内 外 数据 库 商 相 抗衡 的 文献 
资源 保障 体系 。 


@LDA 模型 与 研究 设计 
2.1 LDA 模型 介绍 

为 探究 过 往 文献 资源 保障 体系 相关 文献 的 
研究 主题 ， 需 要 对 已 发 表 的 相关 文献 主题 演化 
趋势 进行 研究 。 而 一 篇 文章 的 关键 词 有 的 代表 
研究 问题 ， 有 的 代表 研究 方法 ， 有 的 代表 研究 
对 象 ， 因 此 仅 从 关键 词 人 手 不 利于 对 文献 主题 
进行 识别 外。 目前 既 有 研究 大 多 采用 主题 模型 
的 方法 挖掘 主题 和 探究 主题 演化 。 其 中 最 简单 
的 是 词 频 - 道 文档 频率 (Term Frequency- Inverse 
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Document Frequency，TF-IDF)， 将 文档 集 表示 
成 以 文档 为 行 、 以 单词 为 列 的 矩阵 ， 该 矩 阵 的 
值 与 某 一 词 在 特定 文档 中 的 频率 成 正比 ,与 其 
在 多 个 文档 中 的 频率 成 反比 。TF-IDF 容易 出 现 
和 矩阵 稀 玻 的 情况 ， 即 只 是 从 词 频 的 角度 而 非 以 
语义 的 形式 表示 文档 站， 还 容易 低估 在 一 个 类 
中 高 频 出 现 的 却 能 够 代表 这 个 类 的 主题 的 词 外 ， 

因此 需要 不 断 调 整 TF-IDF 的 各 项 参数 以 适应 
实际 需求 所 。 故 本 文 以 LDA (Latent Dirichlet 
allocation ) 主题 模型 为 基础 ， 对 历年 文献 资源 
保障 体系 相关 文献 进行 主题 识别 。LDA 即 隐 含 
狄 利克 雷 分 布 ， 是 基于 “文档 - 主题 - 词 ”的 三 
层 贝 叶 斯 概率 模型 中。 具体 的 联合 概率 公式 为 : 


P(0,z,w|a, PB)= P(Olo)] [ ?Cz,10) POw,lz,,p) 


公式 (1) 
其 中 ，0 表示 主题 分 布 ，x 是 主题 分 布 0 的 先 验 
分 布 ( 即 Dirichlet 分 布 ) 参数 ，8 是 关键 词 分 布 
的 先 验 分 布 参数 ，z 表示 模型 生成 的 主题 ，w 表 
示 模 型 最 终生 成 的 关键 词 ，N 表示 文档 的 词语 
数量 ，M 表示 文档 数量 ， 三 层 概 率 模 型 如 图 1 
所 示 : 


y 


es N 7 7 
n=1 
1 LDA 三 层 概率 模型 


2.2 研究 设计 

此 前 较 少 有 学 者 对 我 国文 献 资源 保障 体 
系 相 关 文 献 进行 主题 演化 分 析 ， 本 文 主要 利用 
LDA 模型 对 相关 文献 进行 主题 识别 ， 实 现 LDA 
模型 对 文献 资源 保障 体系 相关 文献 的 应 用 。 进 一 
步 绘制 关键 词 共 现 网 络 和 主题 演化 桑 基 图 ， 从 安 
观 数量 层面 和 微观 时 间 线 层面 进行 演化 分 析 ， 主 
题 识别 流程 具体 分 为 4 个 模块 ， 如 图 2 所 示 : 
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确定 最 优 
主题 数 
主题 演化 分 析 
构建 LDA 模 型 


2 主题 识别 流程 


(1 ) 数据 库 选 择 和 数据 搜集 。 本 文 的 研究 
对 象 是 国内 文献 资源 保障 体系 论文 主题 演化 发 
展 , 故 选择 CNKI 期 刊 全 文 数据 库 作为 数据 来 源 。 
检索 主题 词 为 “文献 资源 保障 体系 ”“ 文 献 信 
息 资 源 保障 体系 ”“ 文 献 保 障 体 系 ” 和 “文献 
资源 保障 ”， 人 她 辑 连接 词 为 “OR”。 检索 年 份 
为 2021 年 之 前 的 所 有 相关 文献 。 在 人 工 去 除 部 
分 不 相关 的 文献 之 后 ， 累 积 相关 文献 共计 1 429 
篇 ， 将 相关 文献 的 标题 、 关 键 词 、 摘 要 汇总 作 
为 数据 源 备用 。 

(2 ) 数据 预 处 理 。 根 据 以 上 所 收集 到 的 数 
据 ， 对 所 有 文献 的 标题 、 关 键 词 和 摘要 信息 进 
行 合 并 ， 将 其 视 为 代表 该 文献 的 长 文本 ， 之 后 
利用 Python 的 jieba 分 词 工具 包 进 行 中 文 分 词 。 


4 6 8 10 到 14 


number of clusters 
3 簇 内 误差 平方 和 系数 


由 图 3、 图 4 可知， 综合 考 虑 簇 内 误差 平方 
和 系数 ( Distortions ) 和 轮廓 系数 ( Silhouette ) ， 
选择 12 个 聚 类 数 较为 合适 。 笔 者 在 后 续 的 LDA 
建 模 中 将 聚 类 主题 数 设置 为 12，a 和 8 均 保 持 


为 了 提高 分 词 的 效果 ， 需 要 设置 用 户 自 定义 词 
典 , 根 据 多 次 的 分 词 试验 结果 ,将 “文献 资源 ”“ 双 
“大 数据 ”等 专 有 名 词 保 存 进 自 定义 词 
典 以 提高 分 词 结果 的 有 效 性 。 分 词 过 程 中 还 要 
添加 停 用 词 表 ， 本 文选 用 的 是 常用 的 中 文 停 用 
词 表 哈工大 停 用 词 表 。 最 后 将 分 词 的 结果 
进行 保存 ， 作 为 LDA 模型 构建 的 数据 。 
(3 ) LDA 建 模 。 在 用 LDA 模型 进行 主 
题 识别 前 需要 计算 最 优 的 主题 数目 。 本 文采 用 
Python 中 的 scikit-learn 工具 包 中 的 K-means 算 
法 ， 通 过 计算 分 词 文本 的 艇 内 误差 平方 和 系数 
( Distortions ) 和 轮廓 系数 (Silhouette ) 来 确定 
最 优 聚 类 数 k， 其 中 Distortions 系数 越 小 越 好 ， 
Silhouette 系数 越 大 越 好 , 结果 如 图 3、 图 4 所 示 : 


Me 99 
一 流 


2 4 6 8 10 12 14 
number of clusters 


4 轮廓 系数 


和 关键 词 统 一 视 为 一 段 长 文本 ， 故 在 此 各 权重 
一 致 5 

要 想 在 LDA 模型 聚 类 结果 中 探索 不 同 主题 
的 演化 路 径 ， 除 了 结合 文献 发 表 时 间 这 一 自然 


python 库 中 的 默认 值 。 由 于 本 文 将 标题 、 摘 要 


属性 之 外 ， 还 要 通过 计算 文本 相似 度 、 设 定 一 
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< 局 一 
定 的 阔 值 来 确定 具有 较 高 相关 性 的 文本 主题 ， 
进而 判定 为 演化 关系 ， 以 形成 该 类 主题 的 演化 
路 径 。 本 文采 用 计算 余弦 相似 度 的 方法 来 衡量 
不 同年 份 下 同一 聚 类 内 部 文本 的 相似 度 ， 从 而 
确定 主题 间 的 演化 路 径 。 余 弦 相 似 度 的 计算 公 
式 如 下 : 

a A*B 

Similarity = cos(0) ET 

2 (4 *B,) 
YA4) * YTB) At 0) 

余弦 相似 度 的 取 值 范围 在 (0，1 ) 之 间 ， 
取 值 越 大 说 明 两 文本 越 相 关 ， 由 于 文摘 部 分 内 
容 较 长 ， 为 避免 数据 过 于 稀 玻 ， 将 相似 度 指标 
设置 在 0.1， 即 两 文本 相似 度 大 于 0.1 时 ， 可 认 
定 为 具有 演化 关系 ， 并 结合 文本 发 表 年 份 绘制 
主题 演化 路 径 。 

(4 ) 主题 结果 分 析 。 结 合 文献 资源 保障 体 
系 相 关 文 献 的 数量 分 布 和 LDA 模型 聚 类 的 主题 
结果 ， 进 行进 一 步 的 深入 分 析 ， 一 方面 从 宏观 
的 数量 层面 探究 我 国文 献 资 源 保障 体系 的 相关 
文献 数量 的 变化 ， 另 一 方面 从 微观 的 主题 层面 


/篇 
号 
已 》 


文献 数量 


1980 1985 1990 1995 
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探究 我 国文 献 资源 保障 体系 相关 文献 的 主题 演 
化 路 径 。 


@ 文献 资源 保障 体系 主题 结果 及 演 
化 分 析 


3.1 LDA 模型 主题 识别 结果 分 析 

根据 历年 发 表 的 相关 文献 数量 ， 绘 制 逐 
年 折线 图 (图 5)。 在 1983 年 ， 我 国 颁布 了 
《中 华人 民 共 和 国 国家 标准 :文献 著录 总 则 》 
(GB3792.1-83)， 该 文件 将 “文献 ”定义 为 “ 记 
录 有 知识 的 一 切 载体 ”。 这 一 概念 的 提出 ,使 
得 学 术 界 对 于 “文献 ”的 内 涵 与 外 延 有 了 较为 
统一 的 定论 。 渐 渐 地 ，“ 图 书 ”“ 藏 书 ” 这 两 
个 名 词 也 都 逐渐 被 涵盖 在 “文献 ”这 一 定义 之 下 。 
根据 检索 结果 ， 从 1984 年 起 ， 陆 续 有 文献 资源 
保障 体系 相关 的 文献 发 表 ， 与 之 伴随 的 正 是 图 
书馆 职能 转变 的 探讨 : 将 图 书馆 藏书 从 收藏 化 
为 利用 ， 更 好 地 为 社会 各 界 的 文献 资源 需求 提 
供 保 障 。2000 年 前 后 ， 相 关 文 献 的 数量 开始 快 
速 上 升 ， 而 在 2010 年 往 后 ， 相 关 文 献 的 数量 开 
台 呈 现下 降 的 趋势 。 


2000 2005 2010 2015 2020 


年 份 /年 


5 相关 文献 数量 折线 图 


表 1 为 LDA 主题 模型 识别 结果 ， 从 同一 主 
题 下 的 词 项 中 ， 选 取 概 率 较 高 且 具 有 主题 意义 
的 词 项 ， 并 归纳 出 相应 的 主题 标识 来 代表 该 主 
题 。 由 表 1 可知, 信息 资源 评价 、 文 献 资 源 建设 、 
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文献 资源 共享 、 数 字 图 书馆 等 一 系列 与 文献 资 
源 保障 体系 相关 的 主题 被 识别 出 来 。 根 据 相关 
文献 发 表 数 量 的 逐年 变化 ， 将 相关 的 文献 数据 
划分 为 三 个 部 分 , 分 别 为 工时 期 (1984-1999 年 )、 
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开 时 期 (2000-2010 年) 和 亚 时 期 (2011-2020 年 )， 
并 利用 CiteSpace 可 视 化 软件 绘制 相关 文献 的 关 
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键 词 共 现 网 络 ( 图 6- 图 8) ， 展 现 相 关 主 题词 
之 间 的 联系 。 


表 1 LDA 模型 主题 识别 词 项 


主题 编号 主题 标识 词 项 
Topic 1 “信息 资源 评价 评价 指标 体系 专家 用 户 文献 计量 绩效 
Topic 2 ”特色 文献 资源 特种 文献 地 方 西部 少数 民族 小 语种 特色 
Topic3 ”图 书 情报 机 构 机 构 设 置 。 业务 重组 ”基层 图 书馆 ”图 书馆 联盟 ” 馆 舍 建设 总 分 馆 
Topic 4 ”文献 资源 共享 共 建 共享 ” 馆 际 互 借 文献 资源 布局 ”资源 布局 ”资源 共 建 整合 
献 资源 资源 Ey 人 
Topics XR DU 文献 资源 保障 ”CALIS NSTL BALIS 省 级 国际 
系统 体系 
Topic 6 高 校 图 书馆 高 校 图 书馆 ”重点 学 科 资料 室 学 科 导 航 教学 研究 生 
Topic 7 数字 图 书馆 数字 文献 ”数字 资源 图 书馆 自动 化 。 元 数据 “电子 图 书馆 智慧 图 书馆 
Topic 8 ”文献 资源 建设 ”科技 文献 资源 标准 文献 “农业 文献 “体育 文献 ”医学 文献 ”农业 文献 
Topic 9 文献 传递 文献 传递 。 原文 传递 。 期 刊 订购 查 新 文 传 模式 费用 
Topic 10 文献 收藏 馆藏 经 费 数据 库 文献 保护 修复 剔 旧 
Topic 11 信息 服务 知识 服务 ”参考 咨询 ”知识 经 济 产权 法 律 保护 文献 出 版 
Topic 12 文献 组 织 元 数据 数据 挖掘 MARC 检索 采访 文献 组 织 
公共 图 稍 。 。_z 信 息 开发 
藏书 结构 
211 工 程 
航海 救 育 知识 经 济 
A i == 从 项 结构 依 藏 资源 
集 陪 ,大 学 图 书信 后 人 全 ee 高等 院 辽 
文献 资源 图 书馆 管理 模式 $2 ET 
借阅 服务 7 a 区 献 资 源 保 障 人 利和 区 吉 用 商科 ew 资源 保障 
辐 产 杖 人 一 合并 办 学 太一 世纪 长、 一 
和 人、 一 ~ 一 PT 
现代 化 建设 者 记 全 现代 从 建设 网关 名 檬 光 电子 图 忆 稍 信息 环境 
ST 全 SS 大 从 以 保 陵 似 系 -文献 资料 5 赴 变 
全 ONSE RB i :构建 TN 
(Sui ‘cernet ci 保障 亲生 Sjoysg 信 息 资 浙 
吉庆 商人 文 内 叙 源 建 设 入 受 光 献 信和 ee et 
A 77 da TPR IE RS on 
En 了 T 二 一 的 才 精 失 栅 榴 是 国 国家 性 大 高 校 有 网络 化 建设 ， ， ，， 
< 一 图 书信 建设 内 你 扩 体 条 一 < 文献 资源 保障 系统 
对 六 因 高 等 教育 文献 保障 语 去 9 = ~ 文献 信息 服务 各 信守 全 一生 二 储 报 中 心 入 泊 共 部 zo 
人 上 路 肋 图 用 依 吕 俏 长 EN i 9 符 建 说 
有 全 国民 并 和 SN 革 巩 交 南 保 队 未 交 二 本文 衣 届 源 共 建 世 
ZEN NS Hy Ne ee 克 城 社 科 信 息 网 络 
Me zy 攻 肛 信息 筑 源 保 队 体系 上 可 资 源 保障 措 式 
文 栈 蔡 息 服务 网 络 wa 信息 资源 采集 


(得 技 文献 资源 
ji 科技 信息 机 攀 


6 | 时 期 (1984-1999 年 ) 关键 词 共 现 网 络 


I 时 期 (1984-1999 年 ) 的 主题 主要 集中 在 
Topic3 图 书 情报 机 构 、Topic4 文献 资源 共享 、 
Topic6 高 校 图 书馆 、Topic8 文献 资源 建设 、 


Topic10 文献 收藏 与 Topic12 文献 组 织 。 研 究 内 
容 主要 是 传统 的 图 书馆 等 图 书 情报 机 构 职 能 研 
究 与 新 世纪 的 展望 和 规划 。 
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喜人 枚 每 之 兴 订 
喜 资 源 保障 体 素 Th 
向 书 符 ([ 宝 ) ”靖江 文 南美 工 
四国 考 页 学 ut i 
而 -4 文献 信息 服务 后 
4 
共 现 网 络 
;当代 漠 估 党 闪 天 坟 入 伯 条 ote 


床 话 
文献 资源 保障 体系 
> 钦 性 基础 讼 有 aa 
, 理 研 成 大池 放 了 
科研 基础 设 吝 ” 


人 文 社会 科学 


8 川 时 期 (2011-2020 年 ) 关键 词 共 现 网 络 


20 世纪 的 文献 资源 主要 还 是 以 纸 质 文 献 资 
源 为 主 ， 但 是 数字 化 的 文献 资源 也 逐渐 发 展 起 
来 ， 与 之 相对 应 的 是 数据 库 的 变化 发 展 ，1986 
年 ， 国 家 海洋 局 情报 所 首先 引进 国外 只 读 光 盘 
(CD-ROM ) 数据 库 以 后 ， 各 高 校 图 书馆 和 情 
报 机 构 也 纷纷 引入 只 读 光盘 ， 用 于 课题 检索 ， 
具体 包括 定 题 服务 、 回 溯 检 索 、 专 题 服务 、 成 
果 查 新 和 专利 审查 的 查 新 等 由 。1992 年 ， 由 中 
国 科技 情报 研究 所 重庆 分 所 数据 库 人 研究 中 心 推 
出 的 《中 文科 技 期 刊 篇 名 数据 库 》 (CB ISTIC/ 
CEPC Periodicals ChinaBase ) 只 读 光 盘 版 正式 发 
行 ， 系 我 国 大 陆 第 一 张 中 文 数据 光盘 。1997 年 
1 月， 《中 国学 术 期 刊 (光盘 版 ) 》 正 式 定 期 发 
行 ， 是 我 国 第 一 部 大 规模 集成 化 学 术 期 刊 全 文 
数据 库 ， 图 书馆 界 将 此 视 为 我 国 进入 数字 图 书 
馆 时 代 的 标志 和 里 程 碑 。 

然而 ， 互 联网 的 发 展 速度 远 快 于 光盘 数据 
库 的 发 展 速度 。 在 世界 银行 的 《1998 年 度 世 界 
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发 展 报告 》 提 出 国家 知识 基础 设施 (National 
Knowledge Infrastructure，NKI) 的 概念 

后 ，1999 年 3 月 ， 王 明亮 提出 要 建设 中 国 知 
识 基 础 设施 工程 (China National Knowledge 
Infrastructure，CNKI ) 。 重 庆 维普 资讯 有 限 公 司 
于 2000 年 建立 了 维普 资讯 网 。 万 方 数据 公司 在 
20 世纪 90 年 代 初 推出 国内 第 一 个 资讯 产品 

《中 国企 业 、 公 司 及 产品 数据 库 》。 至 此 , 知 网 、 

维普 和 万 方 逐 渐 成 为 国内 主流 的 三 大 数据 服务 平 


人 
上 


IT 时 期 (2000-2010 年 ) 和 亚 时 期 (2011- 
2020 年 ) 的 主题 主要 集中 在 Topicg 文献 资源 建 
设 、Topic4 文献 资源 共享 、Topic6 高 校 图 书馆 、 
Topic5 文献 资源 保障 系统 等 主题 。 可 见 21 世纪 
所 面临 的 主要 挑战 是 建设 面向 新 时 代 、 面 向 社 
会 各 个 领域 的 文献 信息 资源 ， 逐 步 建立 起 文献 
资源 保障 体系 。 

文献 资源 保障 体系 是 一 个 集 文献 的 收集 、 


202310.00731v1 


chinaXiv 


贮存 、 揭 示 、 传 递 、 利 用 等 诸多 功能 为 一 体 的 
社会 系统 外。 在 整个 文献 资源 保障 体系 的 运行 
模式 上 ， 肖 希 明 认为 等 级 结构 控制 的 方式 是 构 
建 我 国文 献 资 源 保障 体系 模式 的 正确 选择 ， 在 
以 大 系统 的 等 级 结构 控制 为 基本 构架 的 同时 ， 
吸收 其 他 控制 方式 的 优点 , 构建 一 个 由 地 区 (省 、 
市 、 自 治 区 ) 级 、 区 域 (行政 大 区 ) 级 和 国家 级 
文献 资源 网 构成 的 三 级 网 络 结构 模式 内。 孙 瑞 
英 在 此 基础 上 提出 增加 建立 国际 级 保障 体系 的 
建议 外。 

Topic5 文献 资源 保障 系统 是 文献 资源 保障 
体系 研究 中 的 重要 实践 。 作 为 我 国 最 早 启 动 的 文 
献 信 息 资源 保障 系统 ，“ 中 国 高 等 教育 文献 保 
障 系统 ” ( China Academic Library & Information 
System，CALIS ) 于 1998 年 正式 成 立 ，CALIS 
作为 “211 工程 ”建设 的 公共 服务 体系 之 一 ， 为 
各 高 校 的 重点 学 科 发 展 起 到 了 支撑 保障 作用 ， 内 
容 上 涵盖 了 农业 文献 、 法 学 文献 、 商 业 文献 、 医 
学 文献 、 体 育 文献 等 各 个 不 同学 科 领 域 ， 结 构 上 
包括 了 标准 文献 、 科 技 文献 和 外 文 文献 等 不 同 
类 型 的 文献 。 除 CALIS 之 外 ， 后 续 开发 出 了 多 
个 文献 资源 保障 系统 ， 例 如 : 北京 地 区 高 校 图 书 
馆 文 献 资 源 保障 体系 (BALIS ) '"、 江 苏 省 高 等 
教育 文献 保障 系统 (JALIS ) ""、 中 国 高 校 人 文 
社会 科学 文献 中 心 (CASHL ) ""、 国 家 科技 图 
书 文献 中 心 (NSTL ) "和 国家 科学 数字 图 书馆 
(CSDL ) 等 。 
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进入 亚 时 期 (2011-2020 年 )， 自 2015 年 国 
务 院 发 布 了 《统筹 推进 世界 一 流 大 学 和 一 流 学 
科 建 设 总 体 方案 》 ( 简称 “ 双 一 流 ” 建 设 ) 上 


之 后 ，“211 工程 ”建设 逐渐 转 为 “ 双 一 流 ” 建 
设 ，CALIS 以 及 其 他 文献 资源 保障 系统 的 职能 


也 发 生 了 相应 变化 ， 主 要 为 高 校 “ 一 流 学 科 ” 
的 文献 信息 需求 提供 保障 。 
3.2 主题 演化 分 析 

除了 较为 粗 粒 度 地 将 文献 主题 划分 为 三 大 
时 期 进行 关键 词 共 现 分 析 之 外 ， 本 文 还 根据 余 
弦 相 似 度 ， 结 合 文 献 的 发 表 时 间 来 绘制 桑 基 图 
( Sankey Diagram ) ， 进 一 步 探究 文献 资源 保障 
体系 主题 的 演化 路 径 。 桑 基 图 ， 又 称 为 桑 基 能 
量 分 流 图 ， 起 源 于 1898 年 的 “ 莹 汽机 的 能 源 效 
率 图 ”。 在 桑 基 图 中 ， 对 象 用 元 素 块 来 表示 ， 
对 象 间 产 生 能 量 的 流动 方向 及 联系 则 通过 连 线 
来 表示 。 本 文 的 元 素 块 表 示 某 一 研究 主题 ， 主 
题 之 间 的 连 线 表示 主题 之 间 的 演化 关系 ， 主 题 
元 素 块 后 面 的 括号 中 标注 了 首次 出 现 该 主题 的 
年 份 。 为 使 主题 的 演化 路 径 更 清晰 ， 重 复出 现 
的 主题 词 在 后 续 的 演化 路 径 中 将 不 再 表现 出 来 。 

由 图 9 可知， 文献 资源 保障 体系 的 主要 研 
究 内 容 形成 时 间 都 比较 早 ， 到 2000 年 左右 ， 文 
献 资源 保障 体系 的 相关 文献 主题 已 基本 涵盖 ， 
后 续 具 体 探讨 的 是 新 世纪 新 环境 之 下 ， 不 同 建 
设 领域 其 内 容 和 方式 方法 上 的 更 新 与 完善 。 下 
文 主要 对 各 个 主题 内 部 的 演化 进行 分 析 。 
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9 文献 主题 演化 桑 基 图 
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x= 

(1 ) Topic4 文献 资源 共享 是 文献 资源 保障 
体系 的 主要 探究 主题 。1973 年 ， 国 际 图 书馆 协 
会 联合 会 ( 国际 图 联 ，International Federation 
of Library Associations and Institutions, IFLA ) 
首先 提 出 了 UAP (Universal Availability of 
Publications ) 的 概念 ， 即 “国际 图 书馆 资源 共 
享 ”。 该 理念 引入 国内 后 ， 引 起 了 国内 学 者 们 
的 高 度 赞 同 。 远 征 就 指出 ， 实 现 文献 资源 共享 ， 
有 利于 高 校 图 书馆 摆脱 “自给 自足 ”的 自然 经 
济 状 况 ， 可 以 缓解 图 书 经 费 不 足 、 管 理 人 员 人 欠 
缺 、 编 目 能 力 有 限 、 藏 书 空间 饱和 等 一 系列 问 
题 '%。 其 中 ， 馆 际 互 借 是 实现 文献 资源 共享 的 
重要 途径 与 手段 ,我 国 最 早 提出 馆 际 互 借 大 约 
是 在 1939 年 ， 当 时 民国 政府 教育 部 颁布 了 《 修 
正 图 书馆 规程 》 和 《图 书馆 工作 大 纲 》， 文 中 
有 提 到 “ 馆 际 互 借 与 邮寄 ”"”， 某 种 程度 上 说 ， 
这 是 文献 资源 共享 的 开端 。 但 受 限于 当时 国内 
时 代 背 景 ， 文 献 资 源 共享 一 直 未 能 得 到 良好 的 
发 展 。 到 了 20 世纪 末 ， 由 于 信息 技术 的 发 展 ， 
众多 学 者 开始 倡导 图 书馆 自动 化 和 数字 图 
书馆 ”"， 实 体 书 的 馆 际 互 借 也 慢 慢 发 展 为 线 
上 的 更 具有 广泛 意义 上 的 资源 共享 ， 从 而 演化 
出 了 一 系列 与 互联 网 技术 发 展 紧密 相关 的 研究 
主题 ， 例 如 编目 标准 化 、 网 络 建设 、 信 息 资 源 
网 络 化 等 问题 。 在 这 期 间 ， 也 有 学 者 倡议 建设 文 
献 资源 共享 服务 网 络 中 心 ， 或 是 采用 有 偿 共 享 的 
模式 中 ,但 后 续 的 相关 研究 成 果 较 为 有 限 。 在 
2006 年 8 月 ，Google 首席 执行 官 埃 里 克 : 施 密 特 
(EE. Schmidt ) 在 搜索 引擎 大 会 ( SESSanJose2006 ) 
上 首次 提出 “ 云 计算 ”( Cloud Computing ) 这 
一 概念 中。 云 计算 本 质 上 是 一 种 全 新 的 网 络 应 
用 概念 ,使 用 者 可 以 随时 获取 “ 云 ” 上 的 资源 ， 
按 需 求 量 使 用 后 ， 这 一 概念 的 提出 ， 给 文献 资 
源 的 共享 模式 带 来 了 新 的 思路 。 

与 此 同时 ， 中 国 作为 农业 大 国 ， 农 业 文 献 
信息 资源 的 共享 对 于 国家 的 发 展 进步 同样 具有 
战略 意义 。 全 国 农业 文献 资源 共 建 共享 的 最 终 
目的 是 为 全 国 的 农业 教学 、 科 研 、 生 产 和 经 营 
所 需要 的 资源 支持 和 服务 提供 保障 ， 进 而 促进 
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我 国 农业 的 突破 性 发 展 外。 为 提高 西部 地 区 
的 经 济 和 社会 发 展 水 平 ， 巩 固 国防， 国务 院 于 
2000 年 1 月 成 立 了 西部 地 区 开发 领导 小 组 。 此 
前 , 已 有 学 者 针对 西部 地 区 的 农业 文献 资源 共 
建 共享 提出 相应 的 举措 中。 而 相关 文献 保障 体 
系 的 建立 ， 也 将 有 利于 图 书馆 为 西部 大 开发 建 
言 献 策 ， 同 时 为 西部 地 区 做 好 文献 保障 中 。 随 
着 技术 的 发 展 ， 目 前 ， 中 国 农业 科学 院 信 息 化 
服务 网 也 已 经 上 线 ， 通 过 一 系列 信息 化 服务 ， 
打造 智慧 农 科 协 同 平 台 。2013 年 9 月 和 10 月 由 
中 国 国家 主席 习近平 分 别提 出 的 建设 “新 丝绸 
之 路 经 济 带 ”和 “21 世纪 海上 丝绸 之 路 ”的 合 
作 倡 议 ， 打 开 了 我 国 西部 地 区 和 沿海 地 区 的 大 
门 。 做 好 相关 历史 文献 的 梳理 和 保障 工作 ， 不 
仅 有 利于 申报 世界 文化 遗产 ， 推 动 特色 文献 资 
源 的 建设 ， 还 可 以 加 强 对 周边 国家 地 域 文化 的 
研究， 甚至 在 一 定 程度 上 缓解 边境 或 沿海 岛屿 
的 争端 1。 

(2) Topic9 文 献 传递 、Topic10 文 献 收 
藏 、Topic11 信息 服务 和 Topic12 文献 组 织 均 是 
Topic8 文献 资源 建设 过 程 中 演化 出 来 更 加 细 分 
的 主题 。 文 献 传递 与 收藏 是 图 书馆 的 基本 职能 。 
高 校 图 书馆 馆藏 文献 资源 是 高 校 重点 学 科 建设 
的 重要 保障 。 由 于 不 同 省 市 的 经 济 发 展 情况 和 
当地 特色 文献 的 数量 不 同 ， 文 献 资源 布局 的 情 
况 均 有 所 不 同 ， 对 相关 文献 进行 采购 与 收藏 之 
前 ， 需 要 对 文献 资源 布局 进行 充分 的 调研 ， 然 
后 对 缺少 的 有 需求 的 文献 资源 进行 采购 并 收藏 。 
文献 收藏 与 传递 除了 关注 数据 库 技 术 的 演化 发 
展 之 外 ， 还 涉及 多 重 备份 与 适时 迁移 、 开 放 描 
述 方式 、 模 拟 环境 与 环境 封装 、 数 据 恢复 与 数 
据 考古 、 技 术 框 架 与 整体 解决 方案 、 标 准 化 技 
术 等 多 个 方面 1。 

为 了 更 好 地 收藏 与 传递 文献 资源 ， 需 要 
对 其 进行 有 效 的 描述 。 元 数据 是 文献 资源 组 织 
中 信息 描述 的 重要 部 分 ， 元 数据 不 但 在 数字 资 
源 著 录 方 面具 有 重要 的 作用 ， 也 是 使 得 图 书 
馆 走 向 自动 化 的 关键 技术 。MARC ( Machine- 
Readable Catalogue， 机 还 可 读 目 录 ) 与 Dublin 
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Core ( 都 柏林 核心 集 ) 两 种 元 数据 发 展 较为 成 
熟 ， 并 且 在 图 书 情 报 界 得 到 广泛 的 认可 。1965 
年 ， 由 美国 国会 图 书馆 研发 的 MARC( 后 来 称 之 
为 MARC 1 ), 代表 了 机 读 目 录 的 初步 成 果 ， 
后 在 英美 合作 之 下 ，MARC 开 于 1968 年 问世 。 
我 国有 关 部 门 于 1991 年 在 UNIMARC 的 基础 
上 加 上 特定 字段 ， 编 制 了 《中 国 机 读 目 录 通 讯 
格式 》(CNMARC)， 并 多 次 修订 。1995 年 ， 
OCLC 和 NCSA 联合 召开 了 第 一 次 都 柏林 核心 
集会 议 ， 最 终 确 立 了 包含 15 个 核心 元 素 的 核心 
集 。 由 于 MARC 在 粒度 、 语 言 和 可 扩展 性 方面 
具有 一 定 的 局 限 ， 美 国 国会 图 书馆 (Library of 
Congress，LC) 于 2011 年 5 月 提出 了 书目 框架 
模型 ( Bibframe ) ， 力 求 大 大 整合 现 有 的 书目 资 
源 ， 但 其 如 何 适 应 中 文 的 编目 环境 还 有 待 深 入 
研究 。 新 时 代 互 联网 环境 的 迅速 发 展 将 持续 推 
动 文献 信息 资源 组 织 方法 及 理念 的 创新 和 改革 ， 
文献 信息 资源 组 织 将 朝 着 跨 学 科 融 合 、 智 能 语 
义 组 织 以 及 信息 方法 一 体 化 等 方向 快速 发 展 "。 

文献 资源 建设 的 最 终 目的 依然 是 服务 用 
户 、 服 务 读者 。1995 年 5 月 ， 江 泽 民 同 志 在 全 
国 科技 大 会 上 的 讲话 中 提出 了 要 实施 科教 兴国 
的 战略 。 这 促使 图 书馆 从 信息 服务 走向 知识 服 
务 ， 通 过 知识 服务 助 推 科 教 兴国 战略 的 实施 。 
知识 服务 是 指 从 各 种 显 性 和 隐 性 信息 资源 中 ， 
针对 人 们 的 需要 将 知识 提炼 出 来 、 传 输出 去 的 
过 程 中。 知识 服务 正 是 以 文献 信息 资源 建设 为 
基础 的 高 级 阶段 的 信息 服务 。 要 想 充分 开展 知 
识 服务 ， 需 要 深入 挖掘 用 户 的 知识 需求 ， 通 过 
智慧 的 手段 使 显 性 知识 增值 ， 使 隐 性 知识 可 以 
被 传递 和 接收 ， 从 而 提供 个 性 化 信息 服务 ， 
这 些 都 需要 知识 挖掘 、 知 识 组 织 、 知 识 开 发 和 
知识 服务 人 员 素 养 等 多 方面 的 提升 "。 与 此 同 
时 ， 在 线 信 息 服务 提供 商 和 大 型 出 版 商 逐 渐 开 
始 了 语义 网 应 用 实验 , 产生 了 语义 出 版 这 种 新 
的 出 版 形态 , 语义 出 版 将 文献 资源 从 一 个 孤立 、 
静止 的 知识 包 变 成 了 舱 入 在 相互 关联 和 相互 作 
用 的 知识 体系 中 的 知识 工具 中。 语义 出 版 一 方 
面 帮助 用 户 发 现 或 验证 新 知识 ， 男 一 方面 能 使 
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出 版 机 构 获 得 新 的 利润 回报 和 和 鳃 利空 间 。 长 远 
看 来 ， 知 识 服务 和 语义 出 版 仍 将 是 信息 服务 领 
域 的 一 片 红海 。 

(3 ) Topicl 信息 资源 评价 。 在 宏观 层面 上 ， 
建设 文献 资源 保障 体系 离 不 开 高 层次 的 宏观 调 
控 机 构 ， 相 应 的 政策 、 法 规 和 标准 以 及 社会 各 
界 的 力量 。 微 观 层面 上 ， 为 了 保证 更 好 地 建 
设 文献 资源 保障 体系 ， 需 要 对 相关 的 主体 和 客 
体 进 行 评价 评 佑 。 索 传 军 等 将 评价 主体 分 为 个 
体 和 机 构 两 类 ， 评 价 者 个 体 是 指 来 自 于 不 同 领 
域 的 专家 学 者 , 而 评价 机 构 则 包括 经 营 性 机 构 、 
服务 性 机 构 、 学 术 性 机 构 等 中， 再 根据 不 同 的 
评价 客体 形成 不 同 的 评价 体系 ， 例 如 期 刊 评价 
体系 、 馆 藏 文献 资源 评价 体系 、 数 字 文 献 资源 
评价 体系 等 。 安 月 英 构建 了 一 个 二 级 的 馆藏 资 
源 评价 体系 ， 其 中 一 级 指标 包括 资源 内 容 、 检 
索 系 统 、 经 济 性 和 存储 系统 ， 二 级 指标 包括 馆 
藏 资源 保障 能 力 、 权 威 性 、 时 将 性 、 规 范 性 、 
检索 功能 、 检索 效果 、 易 用 性 、 成本、 使 用 情况 、 
存储 系统 的 效率 和 安全 性 的。 马 海 群 等 从 信息 
源 内 容 、 信 息 源 组 织 、 信 息 源 性 能 、 其 他 指标 
这 四 大 层面 构建 了 一 套 含 有 16 个 指标 的 网 络 信 
息 资源 评价 体系 所 。 而 期 刊 评 价 体系 的 指标 包 
括 但 不 限于 总 下 载 量 、 影 响 因子 、5 年 影响 因子 、 
他 引 影响 因子 、 平 均 引 文 数 、Web 即 年 下 载 率 、 
即 年 指标 、 综 合 总 被 引 、 可 被 引文 献 量 、 引 用 
期 刊 数 、 被 引 期 刊 数 、 等 各 类 指标 和 。 

与 其 同时 ， 高 校 的 学 科 评 佑 一 部 分 也 是 对 
相关 学 科 的 文献 资源 进行 评估 。 通 常 ， 我 国 高 
校 院 系 可 根据 科研 工作 和 教学 需要 ， 自 主 购买 
中 、 外 文 文献 ， 这 种 自主 采购 的 方式 针对 性 和 
专业 性 很 强 ”"。 但 也 有 高 校 图 书馆 文献 资源 采 
购 ， 在 以 满足 师 生 的 阅读 需求 的 前 提 之 下 ， 兼 
顾 院 校 的 重点 学 科 的 发 展 ， 打 造 特色 馆 茂 和 重 
点 学 科 馆 藏 。 随 着 “ 双 一 流 ” 等 一 系列 工程 的 
实施 ， 各 个 高 校 在 办 学 的 过 程 中 还 出 现 了 高 校 
合并 、 多 校区 办 学 的 情况 ， 这 使 得 高 校 图 书馆 
在 政治 思想 工作 、 机 构 设 置 和 人 事 管理 、 规 草 
制度 标准 化 、 网 络 和 软件 更 新 、 经 费 管理 、 次 
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x= 
源 共享 、 馆 藏 布 局 等 多 个 方面 面临 变革 外。 
这 一 系列 高 校 和 学 科 的 变革 终 将 需要 相关 文献 
资源 服务 的 配套 优化 。 

总 的 来 看 ， 文 献 资源 保障 体系 的 各 个 主题 
是 相互 交织 在 一 起 一 同 发 展 的 ， 其 主题 演化 大 
致 与 图 书馆 自动 化 的 四 个 发 展 阶 段 和 信息 技术 
发 展 的 趋势 保持 一 致 。 第 一 阶段 为 图 书馆 自动 
化 管理 集成 系统 发 展 阶段 ， 第 二 阶段 为 图 书馆 
在 网 上 进行 全 球 性 、 整 体 化 的 电子 文献 信息 服 
务 的 阶段 外， 第 三 阶段 为 数字 化 图 书馆 阶段 ， 
第 四 阶段 便 是 智慧 图 书馆 阶段 。 在 这 期 间 ， 信 
息 技 术 不 断 地 更 新 迭代 ， 如 光盘 CD-ROM 的 兴 
豪 ， 从 局 域 网 到 互联 网 ，Bibframe 模型 逐渐 蔡 
代 MARC， 云 计算 、 大 数据 、 物 联网 等 一 系列 
新 技术 蓬勃 发 展 。 国 家 层面 也 发 布 不 同 的 政策 
文件 , 从 “211 工程 ”到 “ 双 一 流 学 科 ”, 从 “ 西 
部 大 开发 ”到 “一 带 一 路 ”， 从 “ 九 五 ”的 “人 金 
图 ”工程 到 “十 四 五 ”的 网 络 空 间 命 运 共同 体 ， 
都 在 不 断 地 推进 我 国文 献 资源 保障 体系 的 发 展 
演化 。 综 合 来 看 ， 我 国文 献 资 源 保障 体系 的 演 
化 是 在 图 书 情报 、 计 算 机 等 众多 学 界 的 共同 努 
力 之 下 ， 依 托 先 进 的 信息 技术 ,不断 为 中 国文 
献 保 障 事业 添砖加瓦 的 过 程 。 


@@ 结 论 与 讨论 

本 文 主要 基于 LDA 主题 模型 进行 主题 识 
别 ， 实 现 了 LAD 主题 模型 在 文献 资源 保障 体系 
领域 的 应 用 。 在 文献 资源 保障 体系 的 主题 演化 
路 径 中 ， 形 成 了 丰富 多 样 的 主题 ，2000 年 左右 
基本 已 包含 主要 的 文献 资源 保障 体系 研究 主题 ， 
主要 可 以 分 为 文献 资源 层面 和 机 构 层 面 两 大 内 
容 。 从 资源 层面 来 看 ， 研 究 内 容 包 括 文献 资源 
类 型 与 收集 、 文 献 资源 组 织 与 建设 、 文 献 资源 
服务 与 共享 。 从 机 构 层 面 来 看 ， 高 校 图 书馆 一 
直 是 研究 的 主要 对 象 ， 随 着 文献 资源 保障 体系 
发 展 建设 ， 全 国 性 机 构 与 地 方 基层 机 构建 设 发 
展 迅 速 。 这 两 大 内 容 还 受到 “西部 大 开发 ”、 
“ 双 一 流 ” 学 科 建 设 、“ 一 带 一 路 ”等 一 系列 
宏观 政策 和 “大 数据 ”“ 云 计算 ”“ 数 据 挖掘 ” 
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等 一 系列 新 兴 技 术 的 交叉 影响 。 

为 重 构 文献 资源 保障 体系 ,同样 需要 从 资 
源 角 度 和 机 构 角 度 进行 相应 的 调整 。 从 资源 的 
角度 来 看 ， 在 文献 资源 类 型 与 收集 环节 ， 部 分 
高 校 的 文献 资源 向 重点 学 科 、 强 势 学 科 倾 斜 ， 
忽视 弱势 学 科 、 少 数 民族 地 区 、 非 英语 外 文 文 
献 等 资料 的 采购 ， 但 从 体系 优化 的 层面 上 看 ， 
同样 要 兼顾 “弱势 学 科 ” 和 多 元 发 展 ， 从 而 带 
动 各 高 校 各 学 科 的 水 平 提升 。 在 文献 资源 组 织 
与 建设 环节 ， 数 字 化 建设 是 文献 资源 建设 的 大 
方向 ， 要 将 元 数据 建设 作为 其 核心 ， 实 现 多 渠 
道 元 数据 融合 、 多 类 型 元 数据 映射 、 多 层次 元 
数据 识别 ， 建 立 具有 知识 关联 功能 的 智慧 的 文 
献 组 织 平台 。 在 文献 资源 服务 与 共享 环节 ， 建 
立 以 开放 数据 、 开 放 获 取 、 开 放出 版 等 为 手段 
的 数字 资源 开放 生态 新 模式 的 同时 ， 应 充分 重 
视 用 户 需 求 与 用 户 价值 ， 通 过 抓 取 分 析 用 户 的 
主观 特征 、 行 为 数据 、 偏 好 数据 、 意 见 反 馈 ， 
构建 用 户 画 像 ， 为 用 户 提供 细 粒 度 的 个 性 化 的 
资源 服务 。 

从 机 构 的 角度 来 看 ， 虽 然 多 年 来 发 展 出 各 
类 专门 专项 的 机 构成 员 , 但 存在 不 同 程度 的 元 
杂 、 分 块 严重 、 职 责 重复 、 缺乏 统一 管理 等 问题 。 
建立 统筹 协调 、 部 门 联动 的 文献 资源 保障 体系 
的 管理 机 制 ， 首 先 需要 在 中 央 设 立 跨 系统 、 跨 
学 科 、 跨 部 门 的 全 国 统一 常设 机 构 ， 总 揽 相 关 
文献 资源 的 指挥 与 协调 ; 其次， 向 下 设立 全 国 
性 的 专家 委员 会 与 具体 办 事 机 构 负 责 技术 指导 
与 执行 ; 最 后 ， 依 托 各 级 学 会 与 地 方 图 书馆 下 
设 各 系统 间 的 地 区 联盟 和 基层 组 织 , 实现 分 类 、 
分 级 、 分 工 保障 "”， 从 而 建成 全 国 性 的 横 跨 各 
个 领域 的 文献 资源 保障 体系 系统 。 

本 文具 有 一 定 的 局 限 : LDA 模型 聚 类 中 ， 
个 别 聚 类 内 的 文献 数 较 少 ， 不 能 充分 反映 文献 
的 演化 规律 。 在 进行 演化 路 径 分 析 的 时 候 ， 后 
续 再 次 出 现 的 主题 词 不 再 作为 分 析 展 示 的 对 象 ， 
一 定 程 度 上 会 忽略 主题 演化 过 程 中 更 为 微观 的 
演进 变化 ， 后 续 还 将 继续 在 文献 资源 保障 体系 
主题 演化 更 为 细致 的 方面 深入 研究， 并 探讨 演 
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进 的 机 理 机 制 和 未 来 新 主题 的 识别 预测 。 
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Identification and Evolution Analysis of Literature Themes in Literature Resource Guarantee 
System in China 
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Abstract: [Purpose/significance] By analyzing the path of thematic evolution of literature resource 
guarantee system in China, this paper provides references for reconstructing literature resource guarantee 
System in China. [Method/process] This paper used LDA model to cluster the collected documents. Firstly, it 
used the time period as the basis of division, drew the co-occurrence network of topic words, and explored the 
interactions between topics. Then the paper determined the evolution path within each subject by similarity 
calculation and showed it in the form of visualization by drawing Sankey diagram. [Result/conclusion] 
The study finds that all the relevant themes of literature resource guarantee system in China have basically 
appeared around 2000. The topic mainly includes two categories of resources and institutions, which are 
greatly influenced by computer technology and national policy. The corresponding countermeasures and 
suggestions are given for these two categories of topics. 
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